深度Q网络相关论文
随着科技的不断进步,越来越多的机器人被应用在各种各样的场景中,移动机器人作为智能机器人的重要分支,其路径规划问题一直是国内......
由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q ......
近年来,人工智能的迅速发展,极大改变了人们的生活和工作方式。车、船等载运工具的智能化自主操控,也受到越来越多的关注。区别于......
为适应航运业的快速发展并减少因人为因素导致的船舶碰撞事故发生,文章提出一种基于深度强化学习的深度Q神经网络的船舶避碰决策算......
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为......
无人驾驶汽车由于其有限的电池寿命和计算能力,难以在保证续航的前提下满足一些时延敏感任务或密集任务的处理需求。为解决该问题,在......
面对高维连续状态空间或稀疏奖励等复杂任务时,仅依靠深度强化学习算法从零学习最优策略十分困难,如何将已有知识表示为人和学习型......
为了减少制造成本、提高焊接效率,让机器人能适应不同形状的焊缝,具备类似人一样的自主学习和决策能力,提出将基于强化学习的路径规划......
伴随网络技术及其应用的快速发展,各类网络应用如雨后春笋般涌现,网络流量的模式特征也变得愈发复杂,传统基于规则匹配的入侵检测......
近年来,无人机辅助物联网中数据收集的方法被广泛应用,相比于传统的静态数据收集方法,无人机辅助数据收集的方法克服了地表交通的......
在下行多小区非正交多址接入系统中,功率分配是决定系统性能的关键因素之一。由于多小区系统间的功率优化问题的非凸性,获得最优功率......
随着数据库技术和计算机硬件的发展,当前数据库运行的平台已逐渐转移到多核处理器和大容量的低延迟存储所构成的硬件平台上,由此产......
当今网络通信环境下,接入网络的各种智能设备和移动用户数量急剧增长,频谱资源稀缺的问题也愈加突出。相比传统的正交多址接入(OMA),......
我国于2015年发布了《中国制造2025》计划,其中工业自动化中的机械臂作为主要的技术领域被重点关注。现代工业中机械臂应用还停留......
近年来,随着视频流、移动计算、虚拟现实游戏等技术的广泛应用,对移动实时带宽提出了更高的要求,由于当前4G蜂窝通信技术不能承载......
轮廓误差是在机床加工曲线及曲面时一定会产生的,严重影响着工件的加工质量。轮廓误差的预测和补偿是提高CNC机床轮廓性能以实现更......
随着机器人在实际生活中的应用越来越广泛,机器人的智能化发展也在人们对生活中起到了十分重要的作用。在控制机械臂进行物体抓取......
作为一种脑部疾病,脑卒中是当前临床医学上最常见的疾病之一,具有高致死率和致残率等特点。引发脑卒中的风险因素众多,发病前高效......
深度强化学习(Deep Reinforcement Learning,DRL)可广泛应用于城市交通信号控制领域,但在现有研究中,绝大多数的DRL智能体仅使用当前的......
本文研究了不同深度强化学习算法在医疗应用-虚拟手术室中的表现。通过观察分析,创新性的建立了一个虚拟环境系统,目的是探究智能......
近年来,随着科技和人类生活需求的不断提升,移动机器人路径规划技术成为了机器人研究领域的研究热点问题。在路径规划应用中,移动......
车间调度是对整个生产车间进行控制、优化与管理的核心环节。基于动态作业车间的有效调度算法可以降低制造成本,缩短产品交付时间,......
目前智能决策系统中的经典算法智能化程度较低,而更为先进的强化学习算法应用于复杂决策任务又会导致存储上的维度灾难问题.针对该......
针对现有深度强化学习算法在状态空间维度大的环境中难以收敛的问题,提出了在时间维度上提取特征的基于一维卷积循环网络的强化学......
在长距离自由空间光(FSO)通信中,信号强度会因为受到湍流、散射、吸收等因素的影响而衰减,而大气湍流是最重要的因素。大气湍流会干......
在移动边缘计算的应用场景下,边缘服务器可以提供计算和存储服务。移动设备能够将任务卸载到边缘服务器上进行执行,以加速整体的执......
4G的普及带来了移动互联网时代,联网设备的主力军从个人电脑(Personal Computer,PC)逐渐转变成手机平板等移动终端。随着5G的研究与......
深度强化学习具有深度学习和强化学习的双重优势,不但理论取得重大突破,而且获得实际应用。随着机器人应用领域的广泛,工作环境更......
无人作战飞机(unmanned combat aerial vehicle,UCAV)在进行空战自主机动决策时,面临大规模计算,易受敌方不确定性操纵的影响.针对......
由于传统车间调度方法实时响应能力有限,难以在复杂调度环境中取得良好效果,提出一种基于深度Q网络的深度强化学习算法.该方法结合......
为解决移动机器人仓储系统中的多AGV无冲突运动规划问题,建立了马尔可夫决策过程(MDP)模型,提出了一种新的基于深度Q网络(DQN)的求解方法......
深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以......
针对无线网络环境中多用户之间冲突及干扰影响问题,本文利用马尔可夫框架进行建模分析,提出了一种多用户联合抗干扰决策算法(MJADA......
电磁频谱资源在现代化战争中扮演着十分重要的角色,肩负着各种作战电子装备之间的电磁通信、侦查探测、导航定位等任务。不断增加......
随着智能电网的发展,电网运营需要电力通信网络提供强力支撑。电力通信网络存在大量的智能设备,设备数据传输量迅速增长。如何应对......
目前机器人已经从制造业领域迈向非制造业领域,越来越多的服务引导机器人应用于日常生活中。路径规划是所有具有移动能力机器人不......
在互联网中,企业或组织会通过收费或限制免费的方式在网站中开放自己的技术和应用供网上的潜在客户使用,但出于成本考虑和稳定性以......
近年来快速增长的航空需求给机场运行提出了极大的挑战。实施有效的机场飞行区场面热点管理是利用好平行跑道机场的场面运行资源,......
随着信息技术的发展,智能制造成为制造业的必然发展趋势。在汽车制造领域,为满足多样化的市场需求,多品种、小批量的柔性生产方式......
深度强化学习是人工智能研究的热点领域之一,结合深度学习的感知能力和强化学习的决策能力,学界提出了基于深度模型的深度强化学习......
车联网是第五代移动通信的一个重要应用。在该网络中,存在两种通信链路,一种是车到基础设施(Vehicle to Infrastructure,V2I)的通......
车货匹配平台的出现,缓解了公路货运中信息不对称的问题,提高了公路货运效率和行业组织水平。但是,整体而言我国的车货匹配平台尚......